您现在的位置是:首页 > 恋爱课程恋爱课程

情感修复词咋解释 中文情感分析 (Sentiment Analysis) 的难点在哪?

2021-06-03 18:12:12恋爱课程人已围观

简介情感修复词咋解释 中文情感分析 (Sentiment Analysis) 的难点在哪?但由于不同领域有不同的情感词,比如看上面的例子,“蓝屏”这个词一般不会出现在情感词典之中,但这个词明显表达了不满的情绪。因此需要另外根据具体领域构建针对性的情感词典。首先要找到评论里面的主观句子,再找主观句子里的产品属性,再计算属性对应的情感分。作为句子和篇章级的应用问题,感觉中英文处理不会有本质的区别,不如好好阅读这个领域的两本经典文献,然后再考虑具体的研究问题:

泡学网

情感修复词咋解释 中文情感分析 (Sentiment Analysis) 的难点在哪?

假设分析的对象是手机评论。您可以在京东、亚马逊或中关村找到这款手机的评论。大致如图所示。

情感分析()的第一步是判断一个词是正面还是负面,主观还是客观。这一步主要依赖字典。

英语已经拥有丰富的词典资源:无论是正面还是负面,主客观,以及单词的情感强度,都胜出。

但是在汉语领域,已经有很多用于判断正反的词典资源了,比如,但是用了这些词典后,效果确实不好(最近我也发现了大连发布的情感词汇本体数据库科技大学,但没用过,差评)。中文的开源真的不够英文的细致有效。中文的主客观识别真的是没法直接看的。

中文领域的难点在于:词典资源质量不高,不够细致。此外情感修复词咋解释,缺乏主客观词典。第二步是识别一个句子是肯定的还是否定的,主观的还是客观的。当你有字典时,它很容易处理。直接去匹配,看字典里有哪些词在一个句子中,然后相加计算句子的情感分数。

但是,因为在不同的领域有不同的情感词,比如看上面的例子,“蓝屏”这个词一般不会出现在情感词典中,但是这个词清楚地表达了不满。因此,有必要根据特定领域构建有针对性的情感词典。如果不是那么麻烦,可以使用有监督的机器学习方法。将一堆评论扔到算法中进行训练。分类器训练好后,评论可以分为正面和负面,主观和客观。很容易将其分为正面和负面,就像上面的示例一样。 5星的评论一般是正面的,1到2星的评论一般是负面的,所以可以直接训练,无需人工标注。但主观和客观还不够,一般主观和客观还需要人们去判断。另外,中文主客观词典功能不强,这使得机器学习更难进行主客观判断。中文领域的难点:字典还是太差了。另外,使用机器学习的方法进行主客观判断非常麻烦,一般需要人工标注。另外,中文也找到了资源,比如这个库写在:。您可以计算一个句子的正面和负面情绪值。不过我没用过,具体效果不清楚。第三步,情感挖掘升级为意见挖掘()。在这一步中,您需要从评论中找出产品的属性。以手机为例,屏幕、电池、售后服务等都是它的属性。在这一点上,这取决于评论如何评估这些属性。例如,“屏幕好”,这是积极的。 “一天不够,电池就用完了,作弊”,这个是负面的,很强大。

这就要求在情感分析的基础上,先挖掘出产品的属性,再分析对应属性的情感。在分析了每条评论的所有属性的情感后,可以将它们汇总形成消费者对产品各个部分的评价。接下来,您可以比较不同产品的评估并将它们可视化。如图所示。

这一步的主要目的是准确挖掘产品属性(通常使用关联规则),准确分析相应的情感倾向和情感强度。所以这需要情感分析作为基础。首先在中找到主观句,然后在主观句中找到产品属性,然后计算该属性对应的情感分数。因此,如果前面的基础不牢固,后面就很难准确分析。

中文领域的研究其实很完备,技术也很成熟。但是,需要提高早期情感分析的准确性。总的来说情感修复词咋解释,汉语词典资源不好,做的不是很详细准确。前期有些基础不扎实,后期不容易得到准确的分析结果。

作为句级和章级的应用题,感觉中英文处理不会有本质区别。最好先阅读两个该领域的经典文献情感修复词咋解释,然后再考虑具体的研究问题:

1.Bing Liu's and

2.庞博

Tags:情感修复词咋解释

站点信息

  • 文章统计12929篇文章
  • 浏览统计16816468次浏览
  • 评论统计0个评论
  • 标签管理标签云
  • 统计数据:统计代码
  • 微信:扫描二维码,关注我们